GenAI for audio

See GenAI

Resources

Open ASR Leaderboard - a Hugging Face Space by hf-audio

Code

#CODE Whisper
- https://openai.com/research/whisper
#CODE CrisperWhisper
#CODE Podcastfy - An Open Source Python alternative to NotebookLM's podcast feature: Transforming Multimodal Content into Captivating Multilingual Audio Conversations with GenAI

References

#PAPER Robust Speech Recognition via Large-Scale Weak Supervision (2022)
#PAPER MusicLM: Generating Music From Text (Agostinelli 2023)
- https://google-research.github.io/seanet/musiclm/examples/